Convolutional Neural Networks Based Turkish Text Classification

نویسندگان

چکیده

Bu çalışmada makine öğrenmesi teknikleri ve konvolüsyonel sinir ağları (KSA) tabanlı bir derin öğrenme modeli kullanılarak iki farklı Türkçe metin veri kümesi sınıflandırılmıştır. Metin sınıflandırma çalışmasında Rastgele Orman (RO), Naive Bayes (NB), Destek Vektör Makineleri (DVM), K-En Yakın Komşu (KNN) Algoritmaları geliştirilen KSA seçilen kümelerine uygulanmıştır. dilinde kümeleri, sınıf adedi olarak birbirinden yapıda tercih edilmiş böylece kelime vektör boyutunun aynı deney ortamında başarısına etkisi araştırılmıştır. Kelime temsil yöntemi Terim Frekansı-Ters Doküman Frekansı (TF-IDF) belirlenmiş olup, işlemi öncesi uygulanan durdurma kelimeleri filtreleme kök bulma önişlemlerinin de sonuçlarına katkısı değerlendirilmiştir. Ayrıca vektörlerine öznitelik seçimi uygulanarak boyutları düşürülmüş, nihai da sonuçlara Bahsedilen tüm ön işlemlerin birleşimleri ortaya çıkan vektörlerinin sınıflandırması sonucunda doğruluk F1-skor değerleri karşılaştırılmıştır. Karşılaştırmalar her algoritması özelinde ayrı tablolar halinde sunulmuştur. algoritmaların birbiri ile karşılaştırmasını içeren oluşturularak sonuçlar analiz edilmiştir.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Medical Text Classification using Convolutional Neural Networks

We present an approach to automatically classify clinical text at a sentence level. We are using deep convolutional neural networks to represent complex features. We train the network on a dataset providing a broad categorization of health information. Through a detailed evaluation, we demonstrate that our method outperforms several approaches widely used in natural language processing tasks by...

متن کامل

Recurrent Convolutional Neural Networks for Text Classification

Text classification is a foundational task in many NLP applications. Traditional text classifiers often rely on many human-designed features, such as dictionaries, knowledge bases and special tree kernels. In contrast to traditional methods, we introduce a recurrent convolutional neural network for text classification without human-designed features. In our model, we apply a recurrent structure...

متن کامل

Rationale-Augmented Convolutional Neural Networks for Text Classification

We present a new Convolutional Neural Network (CNN) model for text classification that jointly exploits labels on documents and their constituent sentences. Specifically, we consider scenarios in which annotators explicitly mark sentences (or snippets) that support their overall document categorization, i.e., they provide rationales. Our model exploits such supervision via a hierarchical approa...

متن کامل

Cancer Hallmark Text Classification Using Convolutional Neural Networks

Methods based on deep learning approaches have recently achieved state-of-the-art performance in a range of machine learning tasks and are increasingly applied to natural language processing (NLP). Despite strong results in various established NLP tasks involving general domain texts, there is only limited work applying these models to biomedical NLP. In this paper, we consider a Convolutional ...

متن کامل

Sequential Short-Text Classification with Recurrent and Convolutional Neural Networks

Recent approaches based on artificial neural networks (ANNs) have shown promising results for short-text classification. However, many short texts occur in sequences (e.g., sentences in a document or utterances in a dialog), and most existing ANN-based systems do not leverage the preceding short texts when classifying a subsequent one. In this work, we present a model based on recurrent neural ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: INTERNATIONAL JOURNAL OF INFORMATICS TECHNOLOGIES

سال: 2023

ISSN: ['1307-9697', '2147-0715']

DOI: https://doi.org/10.17671/gazibtd.1165291